整理歸納一下機器學習可以應用在資安領域的那些部分
(1) 威脅證據分析
威脅證據泛指網路攻擊所留下來的軌跡,如日誌、樣本,進行特徵分析萃取,再加以分類。例如Microsoft的惡意程式分類競賽,開放挑戰者設計模型,包含特徵選擇以及監督式模型設計,或是搭配分群演算法進行惡意程式家族的聚類。
(2) 駭客網絡分析
蒐集社群媒體資料,掌握資安專家、論壇成員的討論內容,持續追蹤討論的議題變化、意見領袖、弱點共應商標記、販賣標的、Hacking tools等。會用到的技術包含topic modeling, name entity extraction, social network analysis。
(3) 惡意連結分析
惡意網址經過動態分析後,擷取網域名稱、IP、網址尾端的檔名、甚至是網域的註冊資訊等,加上網址彼此間相連的資訊,建構出關聯網路,這些資訊方便還原出c2以及攻擊特徵。使用到的技術如Association analysis, graph analysis, n-gram analysis, supervised/unsupervised learning。
其他如
(4) 原碼弱點檢測
(5) 網站/主機滲透測試技術
透過機器學習以最短時間探索到最大範圍的弱點切入點。
(6) 黑白名單學習、異常偵測
以機器學習方法學習正常連線行為、正常日誌特徵、正常process分布。藉此透過閥值容忍範圍的調整,偵測出異常樣態。
之前聽過一場講座,講者就是運用machine learning來分辨、偵測出twitter上的Russian Chatbot,很有趣呢!(雖然我對資料科學沒那麼懂@@)